خوشه بندی نتایج جستجوی کاربران در وب با استفاده از الگوریتم های هوشمند
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فنی
- نویسنده مهدی محمدخانی
- استاد راهنما سهیلا کرباسی محمدهادی معظم
- سال انتشار 1393
چکیده
افزوده شدن روزانه بیش از یک میلیون صفحه به اطلاعات موجود در اینترنت به تنهایی نشان دهنده این است که در عصر کنونی ما با کمبود اطلاعات مواجه نیستیم بلکه با فقر دانش روبرو هستیم زیرا کشف دانش و آگاهی سودمند که مستتر در انبوه داده هاست روز بروز مشکل تر و پرهزینه تر می شود. و به طبع آن جستجو برای کاربران نیز فقط با صرف هزینه بیشتر امکانپذیر است.در این پایان نامه ما قصد داریم با بررسی روشهای موجود در خوشه بندی داده هایی که در حقیقت همان نتایج حاصل از جستجوی کاربران در وب هستند ،نقاط ضعف آنها را بیابیم .با انجام آزمایشات با داده های متنوع و در محیط های مختلف به این درک رسیدیم که در خوشه بندی داده های کاربر، کیفیت نتایج بدست آمده از الگوریتم مرسوم خوشه بندی k-means بسیار متغیر بوده و این می تواند از جمله مهمترین دلایل پرهزینه شدن جستجو در اینترنت باشد .به منظور حل این مشکل از الگوریتم های فرا ابتکاری و هوشمند در این زمینه کمک گرفتیم که با توجه به معایب الگوریتم k-means مناسبترین الگوریتم برای جایگزین نمودن ،الگوریتم بهینه سازی ازدحام ذرات بود.اما از آنجا که اینکار در عمل در نرم افزارهای داده کاوی تا کنون صورت نگرفته بود جهت انجام آزمایش و بررسی نتیجه میبایست ابتدا پیاده سازی کد الگوریتم پیشنهادی را با استفاده از مفاهیم نرم افزارهای متن باز تهیه و آنرا به نرم افزار مورد آزمایش وارد کنیم. با انجام دادن این اقدامات و ارزیابی نتایج حاصل دریافتیم که الگوریتم پیشنهادی خوشه های مناسبتر و پایدارتری تولید میکند که در نتیجه می توان در زمان جستجو نتایج ارزنده تری را به کاربر ارائه دهیم و هزینه جستجو را کاهش دهیم. و دستاورد ما علاوه بر کیفیت نتایج جستجو تولید شده ، در قدم بعد با توجه به سابقه و علایق کاربر به زمینه های مختلف ، رسیدن به یک سیستم توصیه گر فیدبک دار جهت تعیین احتمال حرکت بعدی کاربر و ارائه پیشنهاد به آن خواهد بود.
منابع مشابه
جستجوی هوشمند وب با استفاده از خوشه بندی
یافتن اطلاعات، یکی از نیازهای روزمره کاربران اینترنت است. موتورهای جستجو، پراستفاده ترین ابزار برای یافتن اطلاعات در وب هستند. با گذشت مدت زیادی از حضور موتورهای جستجو، و با همه پیشرفت ها در این زمینه، کسانی که بدنبال نیاز اطلاعاتی خود به این موتورها مراجعه می کنند، با لیست طویلی از نتایج جستجو برخورد می کنند. آن چیزی که استفاده از آنها را مشکلتر می نماید، این است که معمولا ترتیب نتایج برگشتی م...
15 صفحه اولخوشه بندی کاربران وب و واکشی اولیه صفحات وب با استفاده از آنالیز معنایی پنهان احتمالاتی
در سالهای اخیر با توجه به رشد سریع وب جهانی، تحقیقات وسیعی پیرامون مدل کردن رفتار پیمایشیِ کاربران در وب¬سایت¬ها انجام گرفته است. در این راستا کاربردکاوی وب با هدف به¬دست آوردن الگوهای رفتار پیمایشی کاربران وب، مورد استفاده بسیاری از محققان قرار گرفته است. به¬طورکلی کاربران وب رفتارهای متفاوتی متناسب با نیازهای اطلاعاتی و وظایف مورد علاقه خود در بازدید از وب¬سایت¬ها از خود نشان می¬دهند، تمامی ر...
15 صفحه اولیک روش ترکیبی خوشه بندی مبتنی بر الگوریتم ژنتیک با استفاده از عملگر های جدید تغییر
The clustering problem under the criterion of minimum sum of squares is a non-convex and non-linear program, which possesses many locally optimal values, resulting that its solution often being stuck at locally optimal values and therefore cannot converge to global optima solution. In this paper, we introduce several new variation operators for the proposed hybrid genetic algorithm for the cl...
متن کاملارایه شاخصی جدید جهت سنجش اعتبار خوشه بندی در الگوریتم های خوشه بندی فازی نوع-2
One of the main issues in fuzzy clustering is to determine the number of clusters that should be available before clustering and selection of different values for the number of clusters will lead to different results. Then, different clusters obtained from different number of clusters should be validated with an index. But so far such an index has not been introduced for interval type-2 fuzzy C...
متن کاملانتخاب خوشه های اولیه به کمک الگوریتم های هوشمند برای مشارکت در خوشه بندی ترکیبی
به علت بدون ناظر بودن مسئله خوشه بندی انتخاب الگوریتمی خاص جهت خوشه بندی یک مجموعه ناشناس امری پر خطر و معمولا شکست خورده می باشد. به خاطر پیچیدگی مسئله و ضعف روش های خوشه بندی پایه، امروزه اکثر مطالعات به سمت روش های خوشه بندی ترکیبی هدایت شده است. پراکندگی در نتایج اولیه یکی از مهم ترین عواملی است که می تواند در کیفیت نتایج نهایی اثرگذار باشد. همچنین، کیفیت نتایج اولیه نیز عامل دیگری است که د...
متن کاملشناسایی خودرو در تصاویر UAV با استفاده از الگوریتم SIFT با رویکرد خوشه بندی عوارض موضعی
در طول چند دههی اخیر محیطهای شهری بسیار بیشتر از گذشته گسترش یافتهاند. یکی از مهمترین مشکلاتی که در اکثر کلان شهرها و حتی شهرهای کوچک وجود دارد مدیریت سیستم حمل و نقل است. یک سیستم نظارتی پیشرفته از وسایل نقلیهی درون شهری امکان...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فنی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023